Міністерство освіти і науки України
Національний університет
“Львівська політехніка”
Кафедра“Інформаційні системи і мережі”
TITLE \* MERGEFORMAT Створення користувацьких словників за допомогою мови DSL
Методичні вказівки до лабораторної роботи
з курсу KEYWORDS \* MERGEFORMAT "Системи автоматизованого перекладу"
для студентів спеціальності SUBJECT \* MERGEFORMAT "Прикладна лінгвістика" базового напрямку 6.030.500 "Філологія"
Затверджено на засіданні кафедри
“Інформаційні системи і мережі”
Протокол № _____
від “___” __________ SAVEDATE \@ "yyyy" \* MERGEFORMAT 2007_ року
Львів - 2007
TITLE \* MERGEFORMAT Створення користувацьких словників за допомогою мови DSL. Методичні вказівки до лабораторної роботи з курсу KEYWORDS \* MERGEFORMAT "Системи автоматизованого перекладу" для студентів спеціальності SUBJECT \* MERGEFORMAT "Прикладна лінгвістика" базового напрямку 6.030.500 "Філологія", AUTHOR \* MERGEFORMAT Голощук Р.О., ст. викладач, Вовк О.Б., асистент, Львів, Вид-во Національного університету “Львівська політехніка”, DATE \@ "YYYY" \* MERGEFORMAT 2007.
Укладачі
AUTHOR \* MERGEFORMAT Голощук Р.О., ст. викладач,
Вовк О.Б., асистент
Відповідальний за випуск Пасічник В.В., д.т.н., проф.
Мета роботи. Ознайомитися та на практиці засвоїти основні принципи створення користувацьких словників за допомогою мови DSL (Dictionary Specification Language).
Теоретичні відомості
Створення словників мовою DSL
Компанія ABBYY Software House анонсувала нове сімейство електронних словників. У нього ввійшли три продукти: нова версія англо-російсько-англійського словника Lingvo 8.0, багатомовний словник Lingvo Multilingual Edition і версія Lingvo 8.0, адаптована для кишенькових пристроїв. У новій версії англо-російсько-англійського Lingvo обновлені словник загальної лексики і словник по обчислювальній техніці і програмуванню. Крім того, у складі продукту з'явився новий граматичний словник LingvoGrammatical (En-Ru), що являє собою опис граматики англійської мови. У його склад входить близько 500 граматичних тем (статей) з описом кожного правила граматики, а також приклади використання.
Мабуть, єдиний недолік - це недостатньо продуманий вибір слів для словників. Зрозуміло, задовольнити вимоги кожного користувача до словникового наповнення неможливо — для цього, власне, призначена убудована в систему Lingvo опція підключення користувальницьких і зовнішніх словників у стандарті DSL. Але відсутність, наприклад, у словниках по нафті і газові прямих посилань на переклад таких абревіатур, як ОПЕК (OPEC — Organization of Petroleum Exporting Countries, Організація країн — експортерів нафти) і МЕА (IEA — International Energy Agency, Міжнародне енергетичне агентство), можна вважати істотною недоробкою.
Починаючи з версії Lіngvo 6.0, до складу системи входить компілятор мови DSL (Dіctіonary Specіfіcatіon Language).
DSL (Dictionary Specification Language) – мова, розроблена компанією ABBYY для розмітки словникових статей відповідно до технології показу словників, прийнятої в Lingvo. Компілятор мови DSL входить до складу ABBYY Lingvo починаючи з 6 версії. У такий спосіб будь-який користувач словника може створити і поширювати свій власний словник.
Основне призначення мови DSL - опис того, як показувати словникову статтю. Мова не визначає в точності структуру картки чи можливі типи інформації. Наприклад, у мові DSL немає поняття "синонім", "лексичне значення" або "синтаксична модель", але є поняття "курсив", "посилання", "підстаття" і т.д. Словник може бути створений прямо мовою DSL у виді простого текстового файлу. Цей файл варто зберегти в кодуванні ANSI або Unicode, а потім змінити розширення файлу на dsl.
Приклад вмісту вихідного файлу і відповідної йому картки в Lingvo:
словниковий
[m1][p][i][c][com][lang id=2]прил.[/p] від[/i] [ref]словник[/ref][/lang][/com][/c][/m] [m1][trn]lexical; lexicographic[/trn][/m] [m2][*][ex][lang id=2]багатий словниковий запас[/lang] — copious ...